Andon Labs評估顯示,頂尖大模型掃地機器人執行“遞黃油”多步驟任務成功率僅40%,遠遜人類。任務涉及跨房間定位、識別包裝、尋找移動人類、交付並返回充電等複雜環節,凸顯AI在家庭場景的侷限性。
Andon Labs研究發現,搭載頂級大模型的掃地機器人執行跨房間遞送黃油等複雜家務任務時,成功率遠低於人類,突顯AI在現實場景中的操作侷限。